Третий семестр

Поиск сходных нуклеотидных последовательной, не кодирующих белки

  1. Определение транспортной РНК,участвовавшей в присоединении 4-го аминокислотного остатка к растущей цепи белка GLMU_ECOLI.

    Результат работы представлен в таблице:
     Аминокислотный остаток в 4-ой позиции белка GLMU_ECOLI N
      Соответствующий кодон в гене glmU 5'-AAU-3'
      Идеальный антикодон 5'-AUU-3'
      Сколько можно было бы ожидать разных тРНК для остатка N, если опираться на генетический код?  2
      Сколько разных тРНК для остатка N аннотировано в геноме кишечной палочки?  1 TRNA, для нее приведено 4 разных гена
      имя гена локализация гена в геноме распознаваемый кодон антикодон
    Характеристика аспарагиновой тРНК: asnT 2042573..2042648; локус - b1977 AAY GUU
    asnW complement(2056051..2056126); локус - b1984 AAY GUU
    asnU 2057875..2057950; локус - b1986 AAY GUU
    asnV 2060284..2060359; локус - b1989 AAY GUU

    Результат поиска всех аспарагиновых тРНК у Escherichia coli K-12

     
    FT                   /note="codons recognized: AAY; anticodon: GUU asparagine
    FT                   /note="codons recognized: AAY; anticodon: GUU asparagine
    FT                   /note="codons recognized: AAY; anticodon: GUU asparagine
    FT                   /note="codons recognized: AAY; anticodon: GUU asparagine
    

    Использованные команды:
    1. grep codon.*asparagine ecoli.embl >codon.txt
    2. seqret ecoli.embl -sask
    Получен файл с последовательностью тРНК (в качестве параментров указывались координаты и имя выходного файла).

  2. Поиск гомологичных тРНК в родственном геноме

    Задание - найти в геноме Bacillus subtilis последовательность, наиболее похожую на последовательность тРНК из E.coli. Поиск проводился с помощью 4-х разных программ для быстрого поиска сходных нуклеотидных последовательностей.

    Результаты поиска

    \
    Программа FASTA BLASTN MegaBLAST discontiguous MegaBLAST
    Длина якоря (нуклеотиды)  6  11  28  11 (или 12)
    Результаты поиска  result_fasta Приведены 5 выравниваний с фрагментами полного генома Bacillus subtilis  result_blastnт.к. длина выравниваний мала. нашлись случайные находки  result_megablastнет находок  result_dmblastрезультаты поиска схожи с результатами для BLASTN
    Число находок с E-value < 0,01  1  0  -  0
    Характеристика лучшей находки:
          E-value  1.7e-06 (AC Z99104)  0.21 (АС Z99113)  -  0.20 (АС Z99113)
          длина выравнивания  65  15  -  15
          вес выравнивания  178.4  30.2  -  30.2
          координаты в геноме  11466..11530  39866..39880  -  39866..39880
    Аннотация лучшей находки по записи EMBL:
          имя гена  trnO-Ile  pksN    pksN
          это тРНК?  да  нет  -  нет
          это тоже аспарагиновая; тРНК?  нет  - -  -

    Использованные команды:

    1. formatdb -i bs_genome.fasta -n bs -p F

      Были получены три индексных файла (bs.nhr, bs.nsq, bs.nin), составляющих мини-банк данных.

    2. blastall -p blastn -d bs -i tRNA.fasta -o result-bs.txt

      Получен файл с одной находкой с высоким E-value.

    3. megablast -d bs -i tRNA.fasta -D 2 -o megblast.txt

      Получен файл, не содержащий находок.

      
          
    4. megablast -d bs -i tRNA.fasta -D 2 -N 1 -W 11 -t 16 -o dismegablast.txt
      Сначала была установлен паттерн длиной в 21 символ. Был получен файл без находок. При ослаблении паттерна до 16 символов результат поиска не улучшился.
    5. fasta34 tRNA.fasta bs_genome.fasta 6

      Длина якоря - 6. Входные файлы были указаны в командной строке, поэтому нужно было ответить на четыре вопроса: сколько находок показать, показать ли ещё, отображать ли выравнивания и сколько. Получен файл с 4 находками и одним единственным значимым выравниванием.

    Сравнение эффективности использованных программ.

    С заданием не справилась ни одна из программ. FASTA нашла тРНК, но изолейциновую. Программы MEGABLAST и discontiguous MegaBLAST нашли случайные находки, короткие последовательности, кодирующие белки. Результаты поиска не улучшаются и при ослаблении паттерна.